25. Mai 2020

Lernziele

  • Ergebnisse inferenzstatistischer Tests interpretieren können


  • Erster Überblick über unterschiedliche inferenzstatistischen Tests


  • Effekstärke t-Test berechnen können


  • Voraussetzungen inferenzstatistischer Tests kennen (t-Test)

Ablauf

Diese Sitzung

  • Recap vorbereitende Aufgaben


  • Übersicht zu inferenzstatistischen Tests


  • Effektstärke & Voraussetzungen t-Test

Recap: Vorbereitende Aufgabe

Berechnung & Interpretation t-Test

Schauen Sie nochmals die zwei vorbereitenden Aufgaben durch: Link

  • Aufgabe 1: Wie ist es Ihnen gelungen die Ergebnisse der beiden t-Tests zu berechnen?
  • Ideen zu Aufgabe 2: “Welche Formulierungen in diesen Ausführungen sind aus den obigen Ergebnissen allerdings so nicht ableitbar?”

Recap: Vorbereitende Aufgabe

Artikel Harks & Hannover, (2020)

Recap: Vorbereitende Aufgabe

Artikel Harks & Hannover, (2020)

Schauen Sie nochmals in den Artikel von Harks & Hannover, (2020):

Was fällt Ihnen zur Hypothese, den dazugehörigen Auswertungen und daraus abgeleiteten Interpretationen auf?

  1. Notieren Sie hierzu Stichpunkte auf PollEv.com/js123
  2. Voten Sie Stichpunkte (Daumen hoch/ runter)

Übersicht inferenzstatistische Tests

 

 

Übersicht inferenzstatistische Tests

Siehe auch ausführlichere Tabelle auf Moodle

Effektstärke & Voraussetzungen t-Test

Effektstärke t-Test

Cohen’s d

t.test(formula = mpg ~ am,  # frequentistischer t-Test
       data = mtcars,
       var.equal = T)
## 
##  Two Sample t-test
## 
## data:  mpg by am
## t = -4.1061, df = 30, p-value = 0.000285
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -10.84837  -3.64151
## sample estimates:
## mean in group 0 mean in group 1 
##        17.14737        24.39231

Effektstärke t-Test

Cohen’s d

# die Funktion `cohen.d` befindet sich im Paket `effsize`
install.packages("effsize")    # Paket installieren (nur 1x)
library(effsize)               # nach jedem Neustart von R Paket laden
cohen.d(formula = mpg ~ am,
        data = mtcars)
## 
## Cohen's d
## 
## d estimate: -1.477947 (large)
## 95 percent confidence interval:
##     lower     upper 
## -2.304209 -0.651685

Voraussetzungen t-Test

angewendet bei…

  • Vergleich des Unterschieds zweier Mittelwerte

Voraussetzungen t-Test

angewendet bei…

  • Vergleich des Unterschieds zweier Mittelwerte
group test ID
Experimentalgruppe 2.951 Ayse
Experimentalgruppe 2.93 Bertram
Experimentalgruppe 3.524 Caroline
Experimentalgruppe 2.541 Daniel
Kontrollgruppe 2.961 Erhan
Kontrollgruppe 1.827 Frank
Kontrollgruppe 2.014 Gert
Kontrollgruppe 1.102 Hannah

Voraussetzungen t-Test

angewendet bei…

  • Vergleich des Unterschieds zweier Mittelwerte
group test ID
Experimentalgruppe 2.951 Ayse
Experimentalgruppe 2.93 Bertram
Experimentalgruppe 3.524 Caroline
Experimentalgruppe 2.541 Daniel
Kontrollgruppe 2.961 Erhan
Kontrollgruppe 1.827 Frank
Kontrollgruppe 2.014 Gert
Kontrollgruppe 1.102 Hannah
ID Vortest Nachtest
Ayse 5.501 4.863
Bertram 2.505 2.43
Caroline 2.25 0.4533
Daniel 3.397 3.823

Voraussetzungen t-Test

angewendet bei…

  • Vergleich des Unterschieds zweier Mittelwerte


  • AV (abhängige Variable): mindestens intervall skaliert


  • UV (unabhängige Variable): binär, nominal skaliert


  • Stichproben:
    • unabhängig: t-Test für unabhängige Stichproben
    • abhängig (auch “gepaart”): t-Test für abhängige Stichproben
    • eine: t-Test für eine Stichprobe

Voraussetzungen t-Test

angewendet bei…

  • Vergleich des Unterschieds zweier Mittelwerte


  • AV (abhängige Variable): mindestens intervall skaliert


  • UV (unabhängige Variable): binär, nominal skaliert


  • Stichproben:
    • unabhängig: t-Test für unabhängige Stichproben
    • abhängig (auch “gepaart”): t-Test für abhängige Stichproben
    • eine: t-Test für eine Stichprobe
# unabhängige Stichproben
t.test(formula = mpg ~ am,
       data = mtcars,
       paired = FALSE)

# abhängige Stichproben
t.test(x = mtcars$mpg,
       y = mtcars$am,
       paired = TRUE)

# eine Stichprobe
t.test(x = mtcars$mpg,
       mu = 0)

Voraussetzungen t-Test

für unabhängige Stichproben

  • unabhängige Stichproben


  • Varianzen \(\sigma^2_1\) und \(\sigma^2_2\) der zu vergleichenden Populationen sind gleich (homogen)

Voraussetzungen t-Test

für unabhängige Stichproben

  • unabhängige Stichproben
    Design


  • Varianzen \(\sigma^2_1\) und \(\sigma^2_2\) der zu vergleichenden Populationen sind gleich (homogen)
    Levene-Test


  • Merkmal in beiden Populationen normalverteilt
    Kolmogorov-Smirnov-Test

Voraussetzungen t-Test

Levene-Test (frequentistisch)

  • \(H_0:\sigma^2_1 = \sigma^2_2\)
  • \(p<.05\): Nullhypothese zurückweisen (\(P(D | H_0)\))
  • Daumenregel: \(p>.20\)
# die Funktion `leveneTest` befindet sich im Paket `car`
install.packages("car")               # Paket installieren (nur 1x)
library(car)                          # nach jedem Neustart von R Paket laden
leveneTest(y = mpg ~ as.factor(am),   # der Levene test möchte, dass am hier als Faktor definiert wird
           data = mtcars)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value  Pr(>F)  
## group  1  4.1876 0.04957 *
##       30                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Voraussetzungen t-Test

Kolmogorov-Smirnov-Test (frequentistisch)

  • \(H_0:\) Variable ist normalverteilt
  • \(p<.05\): Nullhypothese zurückweisen (\(P(D | H_0)\))
  • Daumenregel: \(p>.20\)
# keine Installation von Paketen nötig
# ks.test() ist bereits vorinstalliert und geladen
ks.test(x = mtcars$mpg,    # welche Variable soll getestet werden?
        y = "pnorm",       # welche Verteilung interessiert uns? Hier Normalverteilung: "pnorm"
        mean(mtcars$mpg),  # wie ist der Mittelwert der Variable?
        sd(mtcars$mpg))    # wie ist die Standardabweichung der Variable?
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  mtcars$mpg
## D = 0.1263, p-value = 0.687
## alternative hypothesis: two-sided

Voraussetzungen t-Test

Kolmogorov-Smirnov-Test (frequentistisch)

ks.test(x = mtcars$mpg[mtcars$am == 0],    # welche Variable soll getestet werden?
        y = "pnorm",       # welche Verteilung interessiert uns? Hier Normalverteilung: "pnorm"
        mean(mtcars$mpg[mtcars$am == 0]),  # wie ist der Mittelwert der Variable?
        sd(mtcars$mpg[mtcars$am == 0]))    # wie ist die Standardabweichung der Variable?
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  mtcars$mpg[mtcars$am == 0]
## D = 0.087337, p-value = 0.9987
## alternative hypothesis: two-sided
ks.test(x = mtcars$mpg[mtcars$am == 1],    # welche Variable soll getestet werden?
        y = "pnorm",       # welche Verteilung interessiert uns? Hier Normalverteilung: "pnorm"
        mean(mtcars$mpg[mtcars$am == 1]),  # wie ist der Mittelwert der Variable?
        sd(mtcars$mpg[mtcars$am == 1]))    # wie ist die Standardabweichung der Variable?
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  mtcars$mpg[mtcars$am == 1]
## D = 0.14779, p-value = 0.939
## alternative hypothesis: two-sided

Voraussetzungen t-Test

unabhängige Stichproben: Verletzung der Voraussetzungen

  • Varianzen ungleich (heterogen)
    Welch-Test
# klassischer t-Test für unabhängige Stichproben
t.test(formula = mpg ~ am,
       data = mtcars,
       paired = FALSE,
       var.equal = TRUE)    # Varianzen gleich
## 
##  Two Sample t-test
## 
## data:  mpg by am
## t = -4.1061, df = 30, p-value = 0.000285
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -10.84837  -3.64151
## sample estimates:
## mean in group 0 mean in group 1 
##        17.14737        24.39231

Voraussetzungen t-Test

unabhängige Stichproben: Verletzung der Voraussetzungen

  • Varianzen ungleich (heterogen)
    Welch-Test
# klassischer t-Test für unabhängige Stichproben
t.test(formula = mpg ~ am,
       data = mtcars,
       paired = FALSE,
       var.equal = TRUE)    # Varianzen gleich
## 
##  Two Sample t-test
## 
## data:  mpg by am
## t = -4.1061, df = 30, p-value = 0.000285
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -10.84837  -3.64151
## sample estimates:
## mean in group 0 mean in group 1 
##        17.14737        24.39231
# Welch Test
t.test(formula = mpg ~ am,
       data = mtcars,
       paired = FALSE,
       var.equal = FALSE)   # Varianzen ungleich
## 
##  Welch Two Sample t-test
## 
## data:  mpg by am
## t = -3.7671, df = 18.332, p-value = 0.001374
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -11.280194  -3.209684
## sample estimates:
## mean in group 0 mean in group 1 
##        17.14737        24.39231

Voraussetzungen t-Test

unabhängige Stichproben: Verletzung der Voraussetzungen

  • Varianzen ungleich (heterogen)
    Welch-Test
  • Variablen nicht normalverteilt
    kein Problem, wenn \(N > 30\)
    sonst: Mann-Whitney-U-Test (für ordinalskalierte Variblen)

Workflow

Workflow

bei Datenauswertung

  1. Anwendungsbedingungen:
    • Welche Erkenntnis interessiert mich? (Fragestellung)
    • Welchen Test benötige ich? (z.B. skalenniveau, Anzahl Variablen)
  2. Voraussetzungen prüfen
  3. Test berechnen
  4. Interpretationen ableiten

Vielen Dank

Für die Aufmerksamkeit

Literatur